今日科技头条预定 - OpenAI重磅推出Sora,一款文生视频模型,AI领域又变天了!OpenAI新出的Sora是一款文本到视频的模型,能够根据用户输入的文字指令,创造出长达一分钟的真实影片。视频一镜到底,超高分辨率,纹理清晰可见,场景连贯,其不仅是一次技术突破,更是一场视频创作的革命。Sora能够创建具有多个角色、特定运动类型以及主题和背景的准确细节的复杂场景。该模型可以理解物体在物理世界中如何存在,以及准确地解释道具并生成引人注目的角色来表达充满活力的情感。该模型还可以基于静止图像生成视频,以及填充现有视频上缺失的帧或扩展它。
哇!这绝对堪称近半年来最石破天惊的技术突破!
相较于只能生成短短数秒、局限于小幅度运动画面的Runway和Pika等AI视频技术,Sora模型简直是打开了通往新世界的大门,它实实在在地创造了真正意义上的完整视频作品!
你可别不信,从官方震撼发布的文档中了解到,只需寥寥几句自然语言描述,Sora模型就能够魔术般自动生成长达1分钟的精彩视频内容!
而且令人叹为观止的是,这些视频不仅包含了详尽丰富的场景构建,还有那复杂流畅如同专业摄影师操刀般的运镜效果,甚至角色们的表情动作都栩栩如生、活灵活现!这意味着,即使你不是电影大师,只要拥有丰富想象力和逻辑思维能力,就能摇身一变成为独立创作一部真正电影的导演!
此刻,我们正见证一个崭新时代的到来——人人皆可成为导演的时代已然拉开序幕!
OpenAI这次再度以雷霆之势,不单是穿透了一个全新的AI领域边界,更是有可能彻底颠覆短视频与影视行业既有格局,重塑视觉艺术创造的未来!
聚焦Sora模型,这款来自OpenAI的神奇之作,官方文档将其揭秘为一种扩散模型,其工作原理宛如魔法:从一片静态噪音起步,历经多步骤精心雕琢,逐步去除杂音,最终蜕变为高清流畅的视频画面。值得关注的是,Sora与ChatGPT一样,采用了强大的Transformer架构,并借鉴了DALL-E 3中的重述技术精髓,能够精准解读并具象化用户的文本提示信息。
不仅如此,Sora更展现出无比全面的功能集锦:不仅能依据文本命令生成视频,还能根据图像素材创造出生动逼真的动态影像;它能够准确捕捉并赋予静止图像生命,使之动起来,同时还能提取视频片段中的元素进行扩展或填补缺失帧,简直无所不能!这一前所未有的技术创新,无疑将为我们开启前所未见的视觉叙事新篇章!
以下面Sora生成的AI视频为例,Sora将文字表述的内容很好地呈现,镜头的调度平滑流畅,有全景、有特写,地面水渍的反光和远景的光斑都很好地体现。人物的面部细节丰富,颇有王家卫电影中的光影感觉,很难相信这是AI根据用户随手写的文字生成的。Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually. the street is damp and reflective, creating a mirror effect of the colorful lights. many pedestrians walk about.”
中文指令:“一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信而随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果。很多行人走来走去。
目前,Sora还未向大众开放,未来可能会应用于电影、广告、甚至是个人创作领域,让这些领域的内容更加丰富多彩。但不可否认的是在这个AI革命浪潮下,一部分人的职业会受到很大的影响,也是很多新兴产业的机会,我们的灵境空间还会远吗?AI剧本,AI角色,AI场景,AI镜头,AI特效,AI视频生产。。。全AIGC时代即将到来。我们不妨再大胆一些,AI元宇宙,还会远吗?当Sora与Vision Pro相遇,会碰撞出什么样的火花?AGI时代,真的是呼之欲出了,期待一下~希望,我们不仅仅是时代的看客,而是参与其中的人。。。